home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 367 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  3.0 KB

  1. Path: grafix.xs4all.nl!john.hendrikx
  2. Date: Sat, 06 Jan 96 15:45:44 GMT+1
  3. Newsgroups: comp.sys.amiga.programmer
  4. Distribution: world
  5. Subject: Re:   >>>>>>> The Future: Amiga goes P
  6. MIME-Version: 1.0
  7. Content-Type: text/plain; charset=iso-8859-1
  8. Content-Transfer-Encoding: 8bit
  9. From: john.hendrikx@grafix.xs4all.nl (John Hendrikx)
  10. Message-ID: <john.hendrikx.4458@grafix.xs4all.nl>
  11. Organization: Grafix Attack BBS Holland
  12.  
  13. In a message of 02 Jan 96 Th.huber wrote to All:
  14.  
  15.  >> Get a clue, AKIKO uses slow $dffxxx-type registers, so the first 2 moves
  16.  >> are just as slow as ChipRAM moves.
  17.  
  18.  Th> Yep, $dffxxx registers are slow, that`s true. But I`m refering to
  19.  Th> machines I know:
  20.  
  21.  Th> - A1200 with 68030/50Mhz with overdrive CDROM.
  22.  
  23. Then why did you state in your original post that AKIKO is even faster than
  24. 040's?  This is simply not true.
  25.  
  26.  Th> - CD32 expanded with keyboard and 68030/50Mhz.
  27.  
  28.  Th> (On sysinfo both machines show equal speed values.)
  29.  
  30.  Th> I tried many C2P-codes, but noone could beat the 3.1 OSfunktion on the
  31.  Th> CD32.
  32.  
  33. Give us some timings (with an exact description of what you're doing), maybe
  34. you haven't been using the really fast C2P routines out there.
  35.  
  36.  Th> In my opinion this results by the high number of cache misses you get
  37.  Th> with C2P by CPU. Most values are read once, thus not cacheable.
  38.  
  39. And I guess with AKIKO the values aren't read once?  AKIKO will have the same
  40. amount of cache misses (if there are any, on 040 there probably is only 1 cache
  41. miss for every 16 bytes you read in most C2P routines)
  42.  
  43.  Th> Instructioncache is very effective with most of the C2Pcodes, but it
  44.  Th> doesn`t give such a boost that you could reach akikos registers.
  45.  
  46. You just don't get it; do you know what it means when people say that on 040
  47. the only thing limiting the speed of the C2P conversion is ChipRAM speed?  This
  48. means that all the CPU does is wait for the ChipRAM bus all the time and during
  49. this waiting it can do the entire C2P process all while waiting for the ChipRAM
  50. bus.  On 040's a loop like this:
  51.  
  52. .Loop
  53.   Move.l  d0,(a0)+   ;a0 points to ChipRAM
  54.   Dbra    d1,.Loop
  55.  
  56. is just as fast as:
  57.  
  58. .Loop
  59.   Move.l  d0,(a0)+   ;a0 points to ChipRAM
  60.   Move.l  a1,a1
  61.   Move.l  a1,a1
  62.   Move.l  a1,a1
  63.   Move.l  a1,a1
  64.   Move.l  a1,a1
  65.   Move.l  a1,a1
  66.   Move.l  a1,a1
  67.   Move.l  a1,a1
  68.   Move.l  a1,a1
  69.   Move.l  a1,a1
  70.   Move.l  a1,a1
  71.   Move.l  a1,a1
  72.   Move.l  a1,a1
  73.   Move.l  a1,a1      ;probably even more.
  74.   Dbra    d1,.Loop
  75.  
  76. The 'Move.l a1,a1' instructions can be exchanged for any instruction you like
  77. as long as it doesn't access memory. So you could do And, Or, Add, Lsr, Swap,
  78. whatever and still the routine runs just as fast, all because of the slow
  79. ChipRAM bus.
  80.  
  81. GOOD C2P routines take advantage of this, AKIKO can never go 'faster' than this
  82. simply because ChipRAM is the limiting factor.
  83.  
  84. Grtz John
  85.  
  86. -----------------------------------------------------------------------
  87.  John.Hendrikx@grafix.xs4all.nl   TextDemo/FastView/Etc... development
  88. -----------------------------------------------------------------------
  89. -- Via Xenolink 1.985B1, XenolinkUUCP 1.1
  90.